科研星球

Cell | Cas9脱靶效应的结构机理

Cas9是原核II型CRISPR适应性免疫系统的效应器核酸酶,它能够通过切割双链DNA  (dsDNA) 底物,与向导CRISPR RNA (crRNA) 互补。此外,通过改变向导RNA  (gRNA) 的序列,也能够很容易实现CRISPR-Cas9系统靶向的DNA特异性的编程,因此,这一技术已被广泛应用于基因组工程。crRNA装载和随后的DNA结合和切割都需要Cas9与反式激活crRNA (tracrRNA) 协同作用。目标DNA的结合和切割进一步依赖于目标序列两侧的原间隔相邻基序 (PAM) 的存在。化脓链球菌Cas9 (SpCas9) 因其高活性和5’- NGG-3’ PAM特异性等优势,是目前为止基因编辑中应用最广泛的CRISPR Cas核酸酶。然而,尽管SpCas9在生成靶向DNA断裂方面具有很高的准确性,但它仍然可以通过切割与gRNA不完全互补的基因组DNA序列,从而导致脱靶编辑。因此,鉴于SpCas9和其他Cas9酶的脱靶活性以及其在临床应用中可能会引发的安全性问题,人们对它们的治疗应用提出了安全的担忧。


近日,瑞士苏黎世大学的Martin Jinek课题组在Cell发表了题为Structural basis for Cas9 off-target activity的研究论文。他们报道了Cas9结合到真正脱靶底物的晶体结构,揭示了脱靶结合是由指导脱靶的异源双链中的一系列非经典碱基配对相互作用实现的。包含相对于向导RNA的单核苷酸缺失的脱靶位点是由碱基跳变或多个非经典碱基对而不是RNA隆起形成的。此外,PAM -远端不匹配会导致双向解配对,并诱导Cas9 REC叶中的构象变化,干扰其构象激活。总之,这些研究为Cas9的脱靶活性提供了一个结构基础,并有助于改进向导RNA的理性设计和脱靶预测算法。

0.png

Cas9脱靶位点通常包含一个或几个相对于gRNA的碱基错配。最近的研究已经证实,错配的类型、位置以及错配的总数是决定脱靶DNA结合和切割的重要因素。gRNA -靶向链 (TS) DNA异质双链种子区PAM -近端错配通常对底物DNA的结合和R -环的形成有显著影响。相反,PAM -远端错配与稳定的结合一致;但是,它们的存在往往会导致形成催化能力不足的复合物。此外,Cas9已被证明可以切割含有相对于gRNA序列插入或删除的脱靶底物,认为是通过gRNA- ts DNA异质双链中的核苷酸“凸起”的形成来识别的。许多基于序列相似性的计算工具已经开发用来预测可能的基因组脱靶位点。然而,对于大多数实际脱靶切割过程仍然无法预测。此外,尽管Cas9能够结合含有仅仅5个互补核苷酸的基因组位点,但实际上只有相对较少的脱靶位点能够被切割,导致细胞中检测到脱靶编辑。迄今为止,虽然已经解析了几种靶向结合Cas9复合物的结构,并揭示了其靶向结合和切割的机理。然而,对于脱靶位点的结构机理仍然知之甚少。

在本研究中,作者首先通过体外生化实验分析并揭示了Cas9脱靶蛋白的多样性。接下来为了深入了解脱靶识别和错配耐受的结构基础,作者通过解析sgRNA引导和部分双链脱靶DNA底物的共结晶结构,分析了脱靶效应的相互作用。通过针对AAVS1、FANCF、PTPRC-tgt2和TRAC脱靶,涵盖所有12种可能的错配类型,最终确定并解析了15个脱靶复合物的晶体结构,分辨率为2.25-3.30 Å。在这些结构中脱靶复合物都具有十分相似的一致性,尽管观察到构象变化,但脱靶结构依旧保留了Cas9蛋白与结合核酸之间几乎所有的分子间接触,进一步强调了Cas9在适应错配诱导的异质双链畸变方面的结构可塑性。接下来的分析发现非经典碱基对之间的相互作用促进了脱靶识别。并且双骨架重排可以容纳非生产性错配,双骨架畸变促进了非经典碱基对的形成。由于种子序列的刚性,导致PAM -近端错配被TS畸变所适应。进一步观察结果表明,受限于种子结合区域与TS DNA的相互作用,Cas9可以容纳含有与gRNA种子序列错配的脱靶DNA。Cas9能够通过碱基跳过或多次错配识别单核苷酸缺失的脱靶基因。含有缺失的脱靶复合体可以通过RNA碱基跳跃 (与RNA核苷酸膨胀相反) 或通过多个碱基错配的形成来适应,其精确机制部分取决于缺失的位置。最后,作者发现PAM-远端不匹配扰乱了Cas9构象检验点,在gRNA -脱靶DNA双工的pam -远端区域存在多个不匹配,导致DNA结合复合体中的构象扰动,类似于高保真Cas9变体中特异性增强突变的结构结果。

总的来说,本研究通过解析一系列真实的脱靶结合复合物的晶体结构,阐明了Cas9的错配容忍机制。这些结构揭示了非经典碱基对的形成和异质双链形状的保持是Cas9脱靶耐受的基础。此外,与核苷酸膨胀不同的是,一个gRNA核苷酸的碱基跳跃可以容纳多个连续的错配。并且一个含有三个PAM远端错配的脱靶复合体的结构表现出REC2/3结构域重排,这可能会扰乱Cas9的构象激活,从而调控切割效率。这结构数据揭示了实现脱靶识别的机制的多样性,并为改进的脱靶预测和优化的CRISPR Cas9基因编辑复合物设计奠定了基础。


原文链接:

https://doi.org/10.1016/j.cell.2022.09.026


没有账号?